Harness Engineering 从 Prompt Engineering 到 Context Engineering,再到 Harness Engineering,AI 工程的重心,正在从 “怎么把话说对 这也是 Harness Engineering 开始被频繁提起的背景。 二、Harness Engineering 到底是什么 通俗来说,Harness Engineering 就是围绕 AI Agent 搭建一整套 “可执行、可验证、可约束、可迭代” 的外层运行系统。 模型是 CPU,Harness 才是真正的操作系统。 前两者主要关注模型的输入,而 Harness 关注模型的生存环境。
* **Harness Engineering(驾驭工程)**:Harness 的本意是“马具/挽具”(比如套在马身上用来拉车的皮带),或者指“驾驭自然力量”(如 Harness the power * **Harness 作用于“基础设施与外围(Infrastructure)”**:它几乎涵盖了**除了模型自身权重以外的一切**。 * **Harness Engineering** 是为了 **AI Agent(智能体)** 诞生的。 Harness Engineering 提供的是“状态持久化”、“错误阻断”和“多步规划的脚手架”。 ### 4. 工程化成熟度的区别:手工作坊 vs. * **Harness Engineering 本质上是把 DevOps 的思想引入到了 AI 领域**。
Agent Harness 的解剖结构 原文标题: The Anatomy of an Agent Harness 作者: Vivek Trivedy 来源: LangChain Blog 原文链接 ,而忽视了"harness"的重要性。 本文深入探讨了 Agent Harness 的架构设计,帮助开发者理解如何构建可靠、可扩展的代理系统。 Harness 的核心组成部分 1. 执行引擎 (Execution Engine) 执行引擎负责管理和协调代理的所有操作: 任务调度: 决定何时执行什么操作 流程控制: 管理执行的顺序和依赖关系 并发管理: 处理多个并行任务 资源分配: 模块化设计 将各个组件解耦,使系统更易维护和扩展: Agent ├── Model Interface ├── Tool Manager ├── Memory System ├── Planning Engine
这意味着:持久化保证:Session存储在Harness之外,即使编排循环崩溃,也不会丢数据完整审计:每一步都有记录,合规审查和故障排查都有依据断点恢复:Harness可以通过wake(sessionId )从任何地方恢复,继续上次中断的工作②Harness(编排循环):调用模型,路由工具Harness是Agent的大脑和中枢神经系统。 收益1:容错能力大幅提升当Harness崩溃时会发生什么?耦合设计:容器死了,一切都完了,Session丢失解耦设计:Harness进程挂掉,Session还在数据库里。 新的Harness实例启动,通过wake(sessionId)从上次中断的地方继续这就是"从宠物变牲畜"。Harness现在是可以随意替换的。 你甚至可以:升级Harness的版本,而不中断Session运行多个Harness副本,用作负载均衡(Session的单调性决定了哪个副本该接管)如果某个Harness有bug,快速回滚,无缝继续收益2
https://devops.com/harness-adds-analytics-to-cdaas-platform/ ? 简介 Harness CDaaS平台为应用程序交付提供了一种更加无缝的方法,该方法可以自动检测GitHub,Bamboo,Jenkins,Artifactory或Nexus存储库或任何Git存储库中的新版本 平台地址:https://harness.io/ ? 流水线状态 ? 新建应用 ? 新建应用-选择监控工具 ? 新建发布流水线 ? 选择制品也是根据构建id获取的 ? 流水线执行过程 ?
论文特别指出,很多 Agent 系统的性能差异并非来自模型本身,而是"harness-sensitive",取决于 Harness 层的设计质量。 在 AI Agent 工程里,核心资产是 Harness,可靠性来自 Harness 的约束加上反馈循环,控制是运行时闭环、持续动态的,失败了就改进 Harness,工程师的核心工作是设计 Agent ,进化出更好的 Harness。 Harness 是 Agent 的操作系统。 模型是 CPU,Harness 是操作系统。 在没有 Harness 的情况下,直接在模型上构建生产级 Agent 系统,这不是工程,这是赌博。
Sandbox是Harness时代的服务器Harness是应用,Sandbox是服务器。理解这个关系,你就理解了AIAgent的基础设施。一个核心类比Harness是应用,Sandbox是服务器。 Harness和Sandbox的关系是一样的:Harness:负责推理、决策和工具调用Sandbox:提供隔离的执行环境两者可以独立替换,系统依然工作。 轨迹是Harness产出最有价值的资产。 轨迹和本地数据存储在哪里,决定了谁对Harness拥有实际控制权。 ││Trajectory│└─────────┘└─────────┘└─────────┘└─────────┘控制层本身也很可能是一个Harness——Harness管理Harness。
sync --with_branch_heads --with_tags 编译Android arm Debug默认版本 cd /Users/sunwenwu/flutter_engine/engine /flutter_engine/engine/src --local-engine=/Users/sunwenwu/flutter_engine/engine/src/out/android_debug_unopt /Users/sunwenwu/flutter_engine/engine/src/out/android_debug_unopt /Users/sunwenwu/flutter_engine/engine /Users/sunwenwu/flutter_engine/engine/src/out/android_debug_unopt /Users/sunwenwu/flutter_engine/engine /flutter_engine/engine/src/out/android_debug_unopt /Users/sunwenwu/flutter_engine/engine/src/"
Harness 越强,执行能力越强,Spec 的质量对最终结果的影响就越大。Harness 是放大器,Spec 是被放大的内容。 ** - SDD是必须而且重要的,不是因为 Harness 不够好,而是因为 Harness 把 Spec 的重要性放大了。 他们的 Harness 是什么样的? 它不是 Harness 的附件,而是 Harness 能运转起来的前提之一。 06 结语:Harness 越强,Spec 越重要 让我们回到最初的问题:Harness 来了,SDD 还有意义吗? 有。而且是更有意义,不是更没有意义。 原因很简单:Harness 是放大器。
中间那条统一的执行主链路,靠的就是 Harness 层。 换句话说,没有 Harness 基础理论,OpenClaw 就只是一个“把文本丢给模型”的简单代理。 有了 Harness,它才真正变成了一个可扩展、可控制、可落地的 Agent 运行容器。 为什么 Harness 这个概念突然变重要了 要理解 OpenClaw 和 Harness 的关系,还需要理解另一个背景:模型本身已经足够强,但大家的痛点正在转移。 Harness 至少在管四类事情 从那组对比往下拆,你会发现单 Agent 和完整 Harness 之间,至少差了四类东西。 第一类:给模型看什么。 单 Agent 只有一句 Prompt。 这是 Harness 里最容易被低估的一层。很多人对 Harness 的理解停在“给模型配上工具”,但工具本身不是反馈,工具只是让模型有了手,反馈是让它有了感官。
指南:符号的使用: 在 Earth Engine 类(例如ee.Image)上调用的静态方法被写为Image.staticMethod().
简介 这篇快速文章重点介绍 JMH(Java Microbenchmark Harness)。首先,我们熟悉 API 并了解其基础知识。然后,我们将看到在编写微基准测试时应该考虑的一些最佳实践。
仔细一琢磨,好像并不全是:Harness 的出现,是为了把AI大模型的能力和系统的稳定性真正焊在一起的工程性方法论。 开发者只管定义任务和工具,每会话小时加 0.08 刀,模型升级时 Harness 还能平滑切换,不用从头再来。 so,Harness 突然爆火,还是有点东西的。 but,这跟 OpenClaw 有何关联? OpenClaw 体现的 Harness 三层架构 虽然 Harness 听着很有料,但 OpenClaw 把这些思路变成了本地就能摸到的完整工具(Hermes 如是)。 它们共同说明:模型会换代,但工程边界不会消失,Harness 就是那个能随模型平移、保持可靠的核心。
AI 落地真相:那些 Prompt 之外的事 Harness Engineering 全解 一个尴尬的事实 很多人以为 AI 落地就是"写好 Prompt"。 这就是 Harness Engineering——AI 应用的"驾驭工程"。今天把它的全貌讲清楚。 除了离线的评测集,线上监控同样重要: 成功率:模型调用成功/失败比例 响应延迟:P50/P99 延迟,AI 场景对延迟很敏感 Token 消耗:控制成本 错误分布:哪类问题出错最多,持续优化 七、写在最后:Harness 安全护栏 → 结果返回 ↓ 工具调用 / 记忆管理 / 评测监控 Harness 这,才是 Harness Engineering 追求的东西。
最近AI圈又流行起来一个新词:Harness Engineering,给AI套上缰绳的约束系统。
一 前言Harness 是Devops的一把利剑,用过drone,gitness都知道,Y(aml)asC/P(ipeline)asC 是其核心,其利用模块化可视化的语言将CICD更加便利更加AI的供用户使用 在从Jenkins做migration到Harness过程中,难免会涉及到数据集的转换,比如input sets,还有一些pipeline stage等的转换。 但是Harness在API doc上只提供了go,python,java,curl的API:所以针对一个python用户,如何快速生成python的SDK呢? 办法是有的,一是直接api接口自己手动封装,但是这样比较耗时费力,另外一种办法是使用Swagger Codegen,利用Harness提供的swagger.json生成一个Python SDK。 三 总结本文主要是介绍了Swagger Codegen的原理和使用,通过利用Harness自带的swagger.json文件自动化生成了python的SDK,方便后期二次开发和维护,提升人工效率。
最近在学习activiti,运行《activiti实战》中的SayHelloToLeaveTest代码时,结果出现了“org.activiti.engine.ActivitiException: Can't find scripting engine for 'groovy'”异常,下面给出解决方案: 修改pom.xml文件中groovy依赖,以 <dependency> <groupId
本文将带你从零构建一个 **AI 测试 Harness(测试夹具)**,实现 “规则提取 → LLM 理解 → 测试生成” 的完整闭环。 一、问题:为什么 AI 不会写测试? assert.False(t, s.NeedCaptcha("13800138000")) } ✅ 精准覆盖所有规则 ✅ 命名规范,可读性强 ✅ 自动 mock 依赖 五、进阶:构建自动化测试 Harness 将上述流程封装为一个 AI 测试 Harness: 文本编辑 [源代码] ↓ (AST 规则提取) [结构化规则 JSON] ↓ (LLM Prompt) [AI 生成的测试代码] 支持多语言:Java/Kotlin/Python 的 AST 提取器 本地 LLM 部署:使用 Ollama + CodeLlama,数据不出内网 六、价值:不止于省时间 表格 传统方式 AI 测试 Harness
OpenAI 最近发了一篇工程文章,题目是 Harness engineering: leveraging Codex in an agent-first world。
读完确认了一件事:秘密不在模型,在包模型的那层东西——harness。实时代码仓上下文、prompt缓存、专用工具链、context精简、结构化记忆、并行子agent。 他把方法论叫Thin Harness, Fat Skills。Harness是跑模型的程序,只管四件事:循环调模型、读写文件、管上下文、做安全检查。保持薄。 最常见的错误是反过来——harness塞了一堆东西,skill反而没什么内容。40多个工具定义吃掉半个context window,每个MCP调用2到5秒。 五个概念组成三层:顶上fat skills(90%的价值),中间thin harness(约200行代码),底下deterministic工具。 能力尽量交给skill,执行尽量交给确定性工具,harness越薄越好。模型一升级,所有skill自动变强。